Cuando la cantidad de posibles respuestas es grande -digamos más de 10- es necesario trabajar la información de una manera simplificada; para ello, lo que se acostumbra es dividir el espectro de valores posibles en intervalos, llamados clases que luego se registran en una tabla de frecuencias conocida como distribución de frecuencias agrupadas. Así, en vez de usar cada uno de los valores individuales como categorías, se trabaja con rangos de valores, de modo que se trabaja con una distribución más compacta, que permitirá que los comportamientos y tendencias puedan visualizarse mejor.
Para la construcción de una distribución de frecuencias agrupadas primero aprenderemos a determinar las clases y con ellas construir la tabla de frecuencias hasta llegar a expresar los resultados gráficamente mediante un histograma.
Revisemos las estaturas de 40 alumnos.
Clases
Determinemos las clases.
1. Rango de valores. Ordena los datos e identifica el valor máximo y mínimo. Con ellos vamos a determinar el rango. Como puedes ver, el valor mínimo es 1.51 m, el valor máximo es 1.99 m. El rango es: 1.99 - 1.51=0.48 m
2. Número de clases. Cada uno de los intervalos de valores que utilizaremos en la distribución de frecuencias agrupadas se llama clase. Es una costumbre muy frecuente dividir el rango de valores en 10 clases como máximo, pues con más clases, el trabajo puede ser muy laborioso y con menos clases se puede perder precisión. Cuando el número de datos no es muy grande (digamos a lo más 150), una manera de determinar el número de clases es usando la siguiente fórmula:
número de clases =√n
Donde n es el número de datos. Así que aplicando la fórmula a nuestro ejercicio tenemos √40=6.3≈6, esto es 6 clases.
3. Ancho de clase. Todos los intervalos o clases deben tener el mismo ancho y no deben superponerse, de manera que cada dato caiga dentro de solamente una clase. Para darnos una primera idea del ancho de clase dividiremos el rango entre el número de clases:
ancho =rangono. de clases=0.48m6=0.08m=8cm
Este resultado indica que el ancho de cada clase deberá ser de 8 cm. Sin embargo siempre que sea posible resulta práctico usar números que sean múltiplos de 5 por ello, en nuestro caso elegiremos un ancho de clase de 10 cm. Si esto no es posible, elige un número que resulte conveniente para lograr que todos los datos sean cubiertos por las clases.
4. Límites de clases. Una vez que hemos definido el número de clases y su ancho, podemos empezar a construir la tabla con la distribución de frecuencias. tendremos tantos renglones como clases y una que indique los valores que componen cada intervalo. Podemos también colocar dos columnas adicionales: una que indique específicamente cuál es el límite inferior y otra para el límite superior. Para establecer los límites de cada intervalo observamos el valor del dato mínimo que es 1.51 cm y damos un pequeño margen previo por lo que elegimos como inicio del primer intervalo 1.45 m, y como el ancho es de 10 cm, este intervalo abarcará de 1.45 a 1.54 m, el segundo abarcará de 1.55 m a 1.64 m y así sucesivamente.
Veamos cómo queda la tabla.
Número de clase |
Intervalo de valores |
Intervalo |
Inferior |
Superior |
1 |
1.45 |
1.54 |
1.45-1.54 |
2 |
1.55 |
1.64 |
1.55-1.64 |
3 |
1.65 |
1.74 |
1.65-1.74 |
4 |
1.75 |
1.84 |
1.75-1.84 |
5 |
1.85 |
1.94 |
1.85-1.94 |
6 |
1.95 |
2.04 |
1.95-2.04 |
5. Límites exactos. Existen muchas variables que son continuas, es decir, deben toman valores de entre todos los números reales todos. En nuestro caso, la estatura, es una variable continua, por lo que entre un intervalo y el siguiente no debe quedar fuera ningún número.
Si el límite superior del primer intervalo es 1.54 m y el límite inferior del segundo intervalo es 1.55 m, quedan fuera una infinidad de números,todos los que están entre estos dos números, para evitar esto, vamos a calcular intervalos exactos.
Primero hay que encontrar la diferencia entre 1.54 y 1.55
1.55−1.54=0.01
y la dividimos en 2 partes iguales, esto es
0.012=0.005
Restaremos a cada límite inferior este valor y en el límite superior lo sumaremos. De esta manera tenemos intervalos continuos y abarcaremos todos los números. Colocamos esta información en dos nuevas columnas.
6. Marcas de clase. Antes de proceder a obtener las frecuencias de cada intervalo calcularemos la marca de clase, que es el valor central de cada intervalo, y que se utiliza como valor representativo, al calcular la media y la desviación estándar en las distribuciones agrupadas.
Para calcular la marca de clase, sólo hay que sumar los límites superior e inferior del intervalo y dividir el resultado entre 2. Agregamos una columna con esta información.
Nuestra tabla quedará entonces de la manera siguiente. Observa que también hemos agregado un renglón final para la suma de valores.
Número de clase |
Intervalo de valores |
|
Límites exactos |
Marca de clase |
Inferior |
Superior |
Intervalo |
Inferior |
Superior |
1 |
1.45 |
1.54 |
1.45-1.54 |
1.445 |
1.545 |
1.495 |
2 |
1.55 |
1.64 |
1.55-1.64 |
1.545 |
1.645 |
1.595 |
3 |
1.65 |
1.74 |
1.65-1.74 |
1.645 |
1.745 |
1.695 |
4 |
1.75 |
1.84 |
1.75-1.84 |
1.745 |
1.845 |
1.795 |
5 |
1.85 |
1.94 |
1.85-1.94 |
1.845 |
1.945 |
1.895 |
6 |
1.95 |
2.04 |
1.95-2.04 |
1.945 |
2.045 |
1.995 |
SUMA |
|
|
|
|
|
|